基于二分图的查询推荐算法

基于二分图的查询推荐算法

作者:师大云端图书馆 时间:2023-05-09 分类:硕士论文 喜欢:1456
师大云端图书馆

【摘要】当前,互联网已经成为全世界最大的一个知识库,蕴含着海量的信息,人们可以获取的网络信息与日俱增。用户在面对大规模的网络信息时,却往往茫然于如何更快更准确地找到所需要的信息。搜索引擎可以帮助人们从海量数据中获取信息,已经成为用户获取网络信息的最主要甚至必不可少的工具之一。但目前的搜索引擎与用户的交互方式仍然是主要通过用户根据信息需求自主输入查询关键词进行检索,搜索引擎返回查询结果。由于输入的查询词一般较为简短,并且查询词自身存在歧义性和多义性,搜索引擎并不能准确理解用户真实的搜索意图。基于此种背景下,查询推荐技术如今已经被搜索引擎普遍采用,帮助搜索引擎更准确地了解用户真实的查询意图以及帮助用户构造更加完善的查询。本文主要研究了一种基于二分图的查询推荐算法。采用搜狗查询日志作为实验数据集,对该数据集进行分析与预处理之后,抽取31万条用户历史点击数据作为实验用数据。将用户点击URL在搜索引擎返回结果列表中的排序号和用户点击该URL的顺序号考虑到二分图连接边的权重计算公式中,利用TF-IDF思想计算边的权重,得到Query-URL加权二分图。利用用户点击的URL集合构造向量来表示对应的查询,然后使用余弦相似度方法计算任意两个不同查询间的相似度,最后构建一个描述查询间相关度的查询关系网络图。对一个输入查询推荐N个候选查询的过程是:首先在查询关系网络图上找到该输入查询所在节点的邻居节点构成初始候选查询集合H。若集合H中查询的数目不小于N,直接选取前N个与输入查询相关度得分较高的候选查询进行推荐;若集合H中查询的数目小于N,则将和输入查询节点间接连接的h-hop范围内节点也加入集合H中,利用k-means算法对集合H中的查询进行聚类,最后对包含输入查询的簇进行排序,推荐前N个与输入查询相关度得分较高的候选查询。实验结果表明,本文研究的查询推荐算法具有良好的推荐效果和一定的应用价值。
【作者】朱琅;
【导师】郑诚;
【作者基本信息】安徽大学,软件工程,2014,硕士
【关键词】加权二分图;查询推荐;余弦相似度;查询关系网络;k-means聚类;

【参考文献】
[1]姜冰莹.Ir接口组网测试系统设计与实现[D].北京邮电大学,电子科学与技术,2013,硕士.
[2]刘丽妹.纳米复合永磁材料Nd_2Fe_(14)B/α-Fe磁性能的研究[D].河北师范大学,凝聚态物理,2004,硕士.
[3]王新,王冬冬.湖南城乡初中体育教育资源均衡配置研究[J].体育文化导刊,2014,02:142-145.
[4]张娟.人氟斑牙漂白前后釉质表面结构的观察及着色斑元素分析[D].青岛大学,口腔临床医学,2013,硕士.
[5]游哲.房地产上市公司多元化经营与企业绩效实证研究[D].山西财经大学,会计学,2013,硕士.
[6]杨杨.小学教师课堂教学机智的研究[D].湖南师范大学,教育(专业学位),2013,硕士.
[7]李会强.万州至凉雾铁路主要地质灾害危险性评估及防治建议研究[D].西南交通大学,地质工程,2014,硕士.
[8]林世雄.越南河江省少数民族教育政策实施情况的调查与思考[D].广西师范大学,行政管理,2013,硕士.
[9]胡锦中.多媒体网络教室语文阅读教学研究[D].华东师范大学,教育,2002,硕士.
[10]徐继前.番茄红素抑制内质网应激保护小鼠心肌细胞缺氧/复氧损伤的机制[D].川北医学院,麻醉学,2014,硕士.
[11]孙继文.企业质量信息系统分系统设计与应用研究[D].合肥工业大学,2005.
[12]王强.水平轴风力机三维空气动力学计算模型研究[D].中国科学院研究生院(工程热物理研究所),工程热物理,2014,博士.
[13]龚洵英.量词“遍”“次”“回”的对外汉语教学研究[D].湖南师范大学,汉语国际教育(专业学位),2014,硕士.
[14]张晓霞,唐立新.一种新的求解MMKP问题的ACO&PR算法[J].控制与决策,2009,05:729-733.
[15]张凤清.忆阻细胞神经网络的建模及应用[D].西南大学,信号与信息处理,2013,硕士.
[16]刘永明.可控凸轮机构的研究[D].天津大学,机械设计及理论,2004,硕士.
[17]邱全锋.健身马的设计与研究[D].东北大学,机械设计及理论,2009,硕士.
[18]商树春.试论永乐宫壁画《朝元图》的艺术特征[D].吉林大学,美术学,2014,硕士.
[19]韩志霞.几类SIRS模型渐近行为的研究[D].鲁东大学,应用数学,2013,硕士.
[20]周林轲.电子商务中基于信任的推荐算法研究[D].湖南大学,软件工程,2011,硕士.
[21]张登禄.基于蛋白质组学研究氧化还原相关基因在前列腺癌耐药中的作用及调控机制[D].山东大学,生物化学与分子生物学,2014,博士.
[22]龙许友.高速铁路线路参数对车线动力响应影响分析及参数优化与匹配研究[D].北京交通大学,2008.
[23]代方方.经导管介入治疗儿童室间隔缺损与开胸修补术及镶嵌治疗的对比研究[D].山东大学,儿科学(专业学位),2013,硕士.
[24]杨越.降雨条件下边坡土石混合体的渗透和力学性能试验研究[D].湖南工业大学,岩土工程,2012,硕士.
[25]张世敬.新型农村合作经济发展与财政支持研究[D].西南财经大学,财政学,2014,博士.
[26]陈翔.基于.net建筑企业成本管理系统设计与实现[D].吉林大学,软件工程,2012,硕士.
[27]蒋丹.小学阶段教师绩效工资对教师影响的调查与分析[D].华中师范大学,教育学,2013,硕士.
[28]林艳生,李杰,易泽龙.棒材轧线冷飞剪PLC控制系统[J].冶金自动化,2013,04:49-52.
[29]陈治.数据挖掘在电力市场智能营销决策支持系统的理论研究与系统开发[D].天津大学,2003.
[30]徐钟庚.自我调节学习理论及其教学意义[D].华东师范大学,发展与教育心理学,2001,硕士.
[31]徐雅静.黎锦晖儿童歌舞作品与“五四”精神[D].南京师范大学,音乐学,2012,硕士.
[32]于小光.阜阳市城区中学开展阳光体育运动的现状与对策研究[D].安徽工程大学,体育人文社会学,2012,硕士.
[33]张科.高速电路PCB中同步开关噪声的分析和研究[D].西安电子科技大学,电路与系统,2012,硕士.
[34]陈强.校园网不良图像检索算法设计与实现[D].南昌大学,电子与通信工程(专业学位),2012,硕士.
[35]黎善武.基于大数据技术的大跨度桥梁抖振响应原型监测数据分析[D].哈尔滨工业大学,结构工程,2014,硕士.
[36]党兰学.大规模混载校车路径问题优化算法研究[D].河南大学,地图学与地理信息系统,2014,博士.
[37]丁卫兵.加拿大海外高中在高一年级英语分级教学实现与BC省课程顺利衔接的可行性研究[D].辽宁师范大学,学科教学(专业学位),2012,硕士.
[38]刘义.国内保障性住房发展趋势的分析[D].河北经贸大学,技术经济及管理,2012,硕士.
[39]吴洁.CdSe的形貌调控及其对P3HT/CdSe太阳能电池性能的影响[D].北京化工大学,材料科学与工程,2013,硕士.
[40]贾旭.基于多尺度角点的检测与匹配算法研究[D].东北大学,模式识别与智能系统,2009,硕士.
[41]田妥.凝胶因子DMDBS在相变材料中的应用[D].天津大学,化学工程,2013,硕士.
[42]韩伟基.中国球形容器建设进展[J].石油工程建设.1991(04)
[43]楼洋.激励机制在医院职业道德建设中的应用[D].云南大学,公共管理,2012,硕士.
[44]付明明.顶板垮落对回风巷侧采空区三带内瓦斯运移和爆炸影响的试验研究[D].河北工程大学,采矿工程,2012,硕士.
[45]温尚锟.济南市产业结构与土地利用结构关系研究[D].山东师范大学,土地资源管理,2013,硕士.
[46]袁俊.型号研制计量保证与管理[J].质量与可靠性.2006(05)
[47]田坤.以农民工为劳动者的劳资关系研究[D].天津商业大学,马克思主义基本原理,2013,硕士.
[48]宋洋.银屑病合并天疱疮7例临床分析[D].吉林大学,临床医学,2014,硕士.
[49]郄春凤.青州市谭坊镇农村信访存在的问题及对策[D].中国海洋大学,公共管理,2011,硕士.
[50]刘星.洛阳市广场舞开展现状及对策研究[D].上海师范大学,体育教育训练学,2013,硕士.

相关推荐
更多